首先,它是通過(guò)一個(gè)本地的數(shù)據(jù)計(jì)算,也就是利用高帶寬、靈活互聯(lián)的近存計(jì)算方式,就是片內(nèi)的存、算在一起,來(lái)減少對(duì)外界存儲(chǔ)器的數(shù)據(jù)傳輸和讀寫(xiě),大大提升運(yùn)算效率。第二,是通過(guò)對(duì)一些常用的算子算法,包括脈動(dòng)卷積、向量處理、數(shù)據(jù)重塑、深度學(xué)習(xí)、內(nèi)存讀寫(xiě)等等,通過(guò)硬件來(lái)加速這些運(yùn)算的進(jìn)行,實(shí)現(xiàn)一個(gè)高度可并行的計(jì)算的硬件架構(gòu)。